Build a read-through semantic cache with Amazon OpenSearch Serverless and Amazon Bedrock
这篇文章介绍了一种优化基于 LLM 的应用程序的策略。鉴于对高效且经济高效的 AI 解决方案的需求日益增加,我们提出了一种使用重复数据模式的无服务器读取缓存蓝图。借助此缓存,开发人员可以有效地保存和访问类似的提示,从而提高系统的效率和响应时间。
Rad AI reduces real-time inference latency by 50% using Amazon SageMaker
本篇文章由 Rad AI 的 Ken Kao 和 Hasan Ali Demirci 共同撰写。Rad AI 重塑了放射学报告,开发了简化最繁琐和重复任务的解决方案,并节省了放射科医生的时间。自 2018 年以来,我们的旗舰产品 Rad AI Impressions 使用最先进的专有和开源大型语言模型 (LLM),大大减少了 […]
我们很高兴地宣布,Meta Llama 3.1 8B 和 70B 推理支持已在 Amazon SageMaker JumpStart 中的 AWS Trainium 和 AWS Inferentia 实例上推出。 Trainium 和 Inferentia 由 AWS Neuron 软件开发工具包 (SDK) 提供支持,可提供高性能并将 Meta Llama 3.1 的部署成本降低高达 50%。在这篇文章中,我们演示了如何在 SageMaker JumpStart 中的 Trainium 和 Inferentia 实例上部署 Meta Llama 3.1。
AWS achieves ISO/IEC 42001:2023 Artificial Intelligence Management System accredited certification
Amazon Web Services (AWS) 很高兴成为第一家宣布以下 AI 服务获得 ISO/IEC 42001 认证的主要云服务提供商:Amazon Bedrock、Amazon Q Business、Amazon Textract 和 Amazon Transcribe。ISO/IEC 42001 是一项国际管理系统标准,概述了组织促进负责任地开发和使用 AI 系统的要求和控制。
How 123RF saved over 90% of their translation costs by switching to Amazon Bedrock
这篇文章探讨了 123RF 如何使用 Amazon Bedrock、Anthropic 的 Claude 3 Haiku 和向量存储来高效翻译内容元数据、显著降低成本并提高其全球内容发现能力。
Connect SharePoint Online to Amazon Q Business using OAuth 2.0 ROPC flow authentication
在本文中,我们探讨了如何使用 OAuth 2.0 ROPC 流身份验证方法将 Amazon Q Business 与 SharePoint Online 集成。我们提供使用 PowerShell 脚本的手动和自动方法来配置所需的 Azure AD 设置。此外,我们还演示了如何将这些详细信息连同您的 SharePoint 身份验证凭据一起输入到 Amazon Q 控制台中以完成安全连接。
John Snow Labs Medical LLMs are now available in Amazon SageMaker JumpStart
今天,我们很高兴地宣布,John Snow Labs 的医学 LLM – 小型和医学 LLM – 中大型语言模型 (LLM) 现已在 Amazon SageMaker Jumpstart 上推出。对于医生来说,此工具可以快速了解患者的医疗历程,帮助他们从大量文档中及时做出明智的决策。这种总结能力不仅可以提高效率,还可以确保不会忽略任何关键细节,从而支持最佳患者护理并改善医疗保健结果。
Amazon SageMaker Inference now supports G6e instances
SageMaker 上的 G6e 实例解锁了以经济高效的方式部署各种开源模型的能力。凭借卓越的内存容量、增强的性能和成本效益,这些实例为希望部署和扩展其 AI 应用程序的组织提供了极具吸引力的解决方案。处理更大模型、支持更长上下文长度和保持高吞吐量的能力使 G6e 实例对于现代 AI 应用程序特别有价值。
Build generative AI applications on Amazon Bedrock with the AWS SDK for Python (Boto3)
在本博文中,我们将演示如何使用 Amazon Bedrock 和 AWS SDK for Python (Boto3) 以编程方式整合 FM。我们将探讨如何调用特定 FM 并处理生成的文本,展示开发人员在应用程序中使用这些模型用于各种用例的潜力
Improve factual consistency with LLM Debates
在这篇文章中,我们使用具有基本事实的监督数据集展示了大型语言模型 (LLM) 辩论的潜力。在这篇文章中,我们将通过有说服力的 LLM 来指导 LLM 辩论技巧,其中包括两名专家辩论者 LLM(Anthropic Claude 3 Sonnet 和 Mixtral 8X7B)和一名评委 LLM(Mistral 7B v2),以衡量、比较和对比其与其他技巧(如自洽(与天真的和专家评委)和 LLM 咨询)的表现。
Governing the ML lifecycle at scale, Part 3: Setting up data governance at scale
本文深入探讨了如何使用 Amazon DataZone 为数据网格设置大规模数据治理。数据网格是一种现代数据管理方法,它分散了数据所有权并将数据视为产品。它使组织内的不同业务部门能够创建、共享和管理自己的数据资产,促进自助服务分析并减少将数据实验转换为可用于生产的应用程序所需的时间。
Amazon Bedrock Flows is now generally available with enhanced safety and traceability
今天,我们很高兴地宣布 Amazon Bedrock Flows(以前称为 Prompt Flows)正式推出。使用 Bedrock Flows,您可以快速构建和执行复杂的生成式 AI 工作流,而无需编写代码。Bedrock Flows 使开发人员和企业更容易利用生成式 AI 的强大功能,使您能够为客户创建更复杂、更高效的 AI 驱动解决方案。
Amazon Q Business 提供了一组丰富的 API 来执行管理任务并为您的企业构建具有定制用户体验的 AI 助手。在这篇文章中,我们展示了在使用 AWS Identity and Access Management (IAM) 联合进行用户访问管理时如何使用 Amazon Q Business API。
Revolutionizing knowledge management: VW’s AI prototype journey with AWS
我们很高兴与大家分享大众汽车集团(汽车行业的创新者和欧洲最大的汽车制造商)的历程,他们利用生成式人工智能、Amazon Bedrock 和 Amazon Kendra 设计了基于检索增强生成 (RAG) 的解决方案,让用户更轻松地访问内部信息,从而增强了知识管理。该解决方案可有效处理包含文本和图像的文档,从而显著增强了大众汽车集团在其生产领域的知识管理能力。
在当今数据密集型业务环境中,组织面临着从分散在其基础设施中的各种数据源中提取有价值见解的挑战。无论是数据库中的结构化数据还是文档存储库中的非结构化内容,企业通常都难以有效地查询和使用这些丰富的信息。在本文中,我们将探讨如何使用 Amazon […]
Automate Q&A email responses with Amazon Bedrock Knowledge Bases
在本文中,我们将说明如何使用 Amazon Bedrock Knowledge Bases 和 Amazon Simple Email Service (Amazon SES)(这两项都是完全托管的服务)自动回复电子邮件查询。通过将用户查询链接到相关的公司域信息,Amazon Bedrock Knowledge Bases 可提供个性化响应。
Streamline RAG applications with intelligent metadata filtering using Amazon Bedrock
在本文中,我们探索了一种创新方法,该方法使用 Amazon Bedrock 上的 LLM 智能地从自然语言查询中提取元数据过滤器。通过结合 LLM 函数调用和 Pydantic 数据模型的功能,您可以动态地从用户查询中提取元数据。这种方法还可以提高检索到的信息和 RAG 应用程序生成的响应的质量。
Embedding secure generative AI in mission-critical public safety applications
这篇文章展示了 Mark43 如何使用 Amazon Q Business 创建一个安全的、生成式的 AI 助手,以提高运营效率并改善社区服务。我们解释了他们如何以低代码将 Amazon Q Business Web 体验嵌入到他们的 Web 应用程序中,以便他们可以专注于为客户创造丰富的 AI 体验。